Đột phá AI tuyên bố sẽ làm cho việc truy xuất dữ liệu DNA nhanh hơn 3.200x với độ chính xác tốt hơn, nhưng vẫn chậm hơn lưu trữ tiêu chuẩn
Lưu trữ nội dung số trong DNA là một công nghệ mới, tận dụng độ mật, độ bền và nhu cầu năng lượng thấp của các phân tử DNA. DNA có thể tồn tại hàng thế hệ, trong khi NAND flash và HDD chỉ kéo dài được vài năm hoặc vài thập kỷ. Công nghệ này cung cấp dung lượng dữ liệu cao gấp khoảng 100 triệu lần so với các hệ thống lưu trữ thông thường. Tuy nhiên, việc truy xuất dữ liệu từ lưu trữ DNA là một quá trình phức tạp và tương đối chậm.
Tin vui, các nhà nghiên cứu Israel đã đạt được bước đột phá giúp tăng tốc độ truy xuất thông tin số từ DNA gấp 3,200 lần, theo báo cáo của TechXplore. Nhóm tại Viện Công nghệ Israel (Technion) đã phát triển một công cụ AI có tên là DNAformer, giúp việc truy xuất thông tin từ DNA nhanh chóng và chính xác hơn. Hệ thống này nhanh hơn 3,200 lần so với các phương pháp trước đó và hứa hẹn mang lại kết quả xuất sắc, mở ra khả năng lưu trữ dữ liệu quy mô lớn hiệu quả bằng vật liệu sinh học.
Công nghệ này vẫn chưa đủ nhanh cho thị trường thương mại, nhưng các nhà nghiên cứu tin rằng họ đang đi đúng hướng. Phương pháp mới cho phép xử lý 100MB chỉ trong 10 phút, trong khi các phương pháp hiện tại mất vài ngày. Trong một bài thử nghiệm với 3.1MB, công cụ đã xử lý nhiều loại nội dung khác nhau, bao gồm hình ảnh màu, đoạn ghi âm ngắn của Neil Armstrong trên Mặt Trăng, văn bản về lợi ích lưu trữ của DNA, và dữ liệu ngẫu nhiên giả lập các tệp tin được mã hóa hoặc nén.
Để lưu trữ dữ liệu, các phân tử DNA tùy chỉnh được tổng hợp. Việc đọc thông tin yêu cầu giải mã, nhưng điều này có thể gây ra nhiều lỗi như xóa hoặc thay thế, dẫn đến dữ liệu bị hỏng và không theo thứ tự. DNAformer giải quyết các vấn đề này bằng cách sử dụng các thuật toán để nhận diện các mẫu đúng từ dữ liệu bị lỗi. Mô hình này bao gồm mã sửa lỗi tùy chỉnh và một lớp bảo vệ để phát hiện các chuỗi có độ ồn cao.
DNAformer sử dụng công cụ chuyên biệt để sửa lỗi trước khi chuyển đổi lại chuỗi DNA thành dạng số. Nó dựa trên mô hình transformer được huấn luyện bằng các tập dữ liệu tổng hợp từ một trình mô phỏng tại Technion. Ngoài việc cải thiện tốc độ, DNAformer còn đạt độ chính xác cao hơn tới 40% so với các phương pháp truy xuất nhanh trước đây. Hiệu suất này đánh dấu một bước đột phá trong việc xử lý dữ liệu DNA thực tế, đặc biệt khi gặp phải các chuỗi không hoàn chỉnh hoặc nhiễu mà các phương pháp sửa lỗi truyền thống gặp khó khăn.
Các nhà nghiên cứu dự định điều chỉnh DNAformer theo nhu cầu cụ thể và tin rằng hệ thống này có thể mở rộng cho các ứng dụng công nghiệp và nghiên cứu. Nó được thiết kế linh hoạt, có khả năng phát triển theo tiến bộ trong việc viết và đọc DNA, giúp đáp ứng nhu cầu ngày càng cao về giải pháp lưu trữ bền vững và dung lượng lớn.
Nguồn: www.tomshardware.com/pc-components/storage/ai-breakthrough-claimed-to-make-dna-data-retrieval-3-200x-faster-with-better-accuracy-but-still-slower-than-standard-storage